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(57) Abstract 
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(57) Abrege* 
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proc£d£ de clonage par digestion multiple, 
vecteurs pour sa mise en oeuvre et ses applications . 

La pr6sente invention concerne le domaine de 
la biologie mol6culaire et se rapporte plus 
particuli£rement au clonage de g£nes. 

Le clonage de g6nes est un domaine en pleine 
expansion qui vise notamment & associer fonctions et 
g£nes. Ce domaine se d6veloppe principalement selon deux 
grands axes, d'une part la biologie mol6culaire inverse, 
qui consiste & sequence de fagon massive des banques 
d'ADN g6nomiques ou complement aires, et d 1 autre part la 
biologie mol6culaire directe, qui consiste k trouver la 
sequence responsable d'une activite observee, comme une 
activity enzymatique ou une homologie avec d'autres 
g£nes . 

La presente invention vise pr6cis6ment a 
offrir une nouvelle methode de clonage d'un fragment 
d'acide nucl6ique, designee aussi ci-aprfes DMD pour 
"Digestion Multiple Dif ferentielle", qui repose sur 
1' utilisation syst6matique, combin6e, et preparative des 
sites de restriction presents sur les inserts 
constituant une banque d'ADN complement aire ou 
g6nomique . 

La DMD s' applique notamment aux cas du 
criblage de banques d' expression et du clonage par 
homologie. 

La presente invention trouve egalement des 
applications dans le domaine fastidieux du s6quengage 
quand celui-ci n'a qu'une activity d' identification des 
inserts, ainsi que dans 1' etude du polymorphisme humain, 
notamment dans le cadre de la recherche des 
predispositions g6netiques. 

On designera ci-apres par Caracteristique 
Enzymatique (CE) la resistance, notee "r" ou la 
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sensibility not§e "s", d'un fragment d'acide nucl6ique 
& une enzyme de restriction. Ce qui signifie : 

- qu ■ un fragment qualif i6 "s" pour une 
enzyme de restriction donnee contient le site de clivage 

de cette enzyme, et 

- qu'un fragment qualifies "r" pour une 
enzyme de restriction ne contient pas le site de clivage 

de cette enzyme* 

La Caracteristique Enzymatique Multiple 
(CEM) est alors 1' ensemble des CE obtenues pour 
plusieurs enzymes. On peut alors repr6senter la CEM d'un 
fragment d'ADN contenant un site Eco, un site Bam, deux 
sites Sea, mais pas de site Hind ni Stu, de la fa<?on 
suivante: Eco S Bam s Sca S Hind r Stu r . 

Le procede de 1' invention propose done 
d'associer au fragment, que l'on cherche & isoler au 
sein d'un 6chantillon, sa caracteristique enzymatique 
multiple (CEM) - La recherche dudit fragment peut etre 
r6alis6e par tout moyen connu de l'homme du metier, 
comme sa capacity £ hybrider a une sonde nucleique, 
1' activity enzymatique de son produit proteique, 
1' expression d'une proteine que l'on pourra detecter, 
etc ... 

Le procede de clonage selon 1' invention est 
fond§ sur la demonstration que quand le nombre d' enzymes 
est suffisamment grand, chaque insert de la banque 
poss^de une CEM originale, et qu'en consequence, 
l r invention off re une strat£gie simple de clonage des 
genes A partir de leur CEM. Le procede selon 1' invention 
repose done sur le balayage de banques d'ADN en 
utilisant de fagon combinatoire la repartition des sites 
de restriction sur les inserts constituant cette banque. 

Le principe du procede selon 1' invention 
repose egalement sur 1 'utilisation d'un vecteur de type 
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nouveau car substantiellement d^pourvu de tous les sites 
de clivage par des enzymes de restrictions pour n' en 
garder que ceux n^cessaires a la construction de la 
banque, orient6e ou non, et & son 6ventuel sous-clonage 
dans un autre vecteur. Dans une forme particulidre de 
realisation minimale, le vecteur contient : 

- un site A nfecessaire pour construire la 

banque, et 

- deux sites B, identiques et flanquant le 
site A, utile pour sous-cloner le g6ne une fois celui-ci 
identifie et clon6. 

Cet ensemble pourra etre d6sign6 ci-apr6s 
"trilinker", dont la fabrication schematique est dohn6e 
k la figure 1 en annexe. 

Dans une autre forme particuli^re de 
realisation, le vecteur contient : 

- un site A et un site A 1 , differents, pour 
construire la banque, et 

deux sites B et B' , identiques ou* 
differents, et flanquant les sites A et A 1 , pour sous- 
cloner le g&ne une fois celui-ci identifie et clonfe. 

Avantageusement les sites B sont des sites 
octonuclfeotidiques, de fagon a minimiser le risque que 
des sites B soient presents dans les inserts clones. II 
sera ainsi possible de sous-cloner facilement en un seul 
morceau . 

Environ 100 enzymes de restriction a site 
hexanuclfeotidique ont 6t6 d6couvertes & ce jour. 70 
d'entre-elles ont un site de reconnaissance de type 
palyndrome continu ou discontinu. 

Un vecteur de 1' invention, avantageusement 
un plasmide, ne contient plus, mis k part ces trois 
sites, de sites de restriction hexa ou penta- 
nucl^otidiques correspondant a des enzymes de 
restriction d6j& identifiers ou qui le seront dans le 
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futur. On entend done par "substantiellement", que cette 
destruction peut etre partielle en ce sens qu'elle ne 
concerne que certains des sites connus; seules les 
enzymes correpondantes seront alors utilises dans le 
procfede de 1' invention* Dans 1' expose de 1' invention qui 
suit, on consid^re, comme indiqu6 pr6c6demment que 
environ 50 & 70 types de sites ont 6t§ dfetruits. 

Un vecteur de 1" invention peut §tre 
construit 5 partir d'un plasmide d6ja existant et 
poss^dant toutes les fonctions n^cessaires pour 
permettre d'y cr6er et d ! y manipuler une banque d'ADNC 
ou g^nomique. II peut £tre utile, dans le precede de 
1' invention, que la banque ne contienne plus de vecteur 
seul refermfe sur lui-meme. II est done avantageux que le 
vecteur de 1' invention contienne un syst^me qui 61imine 
tout vecteur seul refermfe sur lui-meme, comme un g6ne 
suicide, un syst^me de disruption de la proximity d'un 
promoteur lambda ou tout autre systeme connu de I'homme 
du metier. 

La technique utilis^e, dans le cadre de 
1' invention pour d^truire tous les sites de restriction 
est une des techniques de mutagenese dirigee simple ou 
multiple dfejci d§crites dans l ! art anterieur, ou tout 
autre technique connue par I'homme du metier, comme le 
remplacement de segments du plasmide par 
oligonucleotides. On obtient ainsi un vecteur resistant 
& 70 enzymes de restriction, numerotees de I a LXX, et 
sensible & 2, designees ci-avant A et B. L'idee de 
detruire simultanement la majority des sites de 
restriction presents sur un plasmide a ete envisagee par 
D. H. Jones et al . (BioTechniques 1994, 16, 4 : 694) 
mais dans un contexte tout different. En effet, cet 
article decrit la destruction par mutagenese multiple de 
31 des 37 sites d'un tres petit vecteur, de fagon £ 
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cr6er un nouvel outil facilitant certaines manipulation 
de I'ADN. 

Le proc£d6 de 1' invention est par ailleurs 
basfe sur la creation d'une banque d'ADN, laquelle selon 
1' application envisag6e contient de 1 k 10 8 et de 
pr6f6rence de l'ordre de 10 5 £ 4.10 6 fragments 
diff6rents de l'ordre de 0,1 kb £ 5 kb chacun, et de 
pr6f6rence, selon les applications du proc§d6 de 
l 1 invention, de 1 £ 2 kb. Dans le mode particulier de 
mise en oeuvre du procedS de 1' invention d6crit a 
l'exemple 6 ci-aprfes concernant 1' etude du 
polymorphisme, la banque peut ne comprendre qu'un seul 
fragment ♦ 

Ainsi, pour 1 1 application du proc6de de 
l 1 invention & la fabrication de banques d' expression ou 
au clonage par homologie, il a 6t6 prepare, comme 
represents schSmatiquement & la figure 2 en annexe, une 
banque d'ADNc de 10 5 fragments diff6rents de 1 kb 
chacun ♦ 

Toutefois, ce modele constitue une 
approximation et est done legerement faux, car la taille 
des fragments est hSterogSne. La taille moyenne des 
inserts 6tant sous-estimee et la taille de la banque 
fetant surestim6e, ce module a 6t6 choisi afin de 
disposer d'une base simple (homog6n§it§ de la taille des 
fragments) et d'un syst&ne d' Stude qui dSsavantage 
1' analyse (taille de la banque surestimee, taille des 
fragments sous-estim6e) de fagon & ce que le procSdS de 
1' invention soit reproductible dans tous les cas. 

Pour 1' application du procede de I 1 invention 
au Southern Blot d 1 identification et & l'etude du 
polymorphisme, il a 6te preparS, comme represents 
sch&matiquement a la figure 3 en annexe, une banque 
d'ADN gSnomique de 4.10 6 fragments differents de Ikb 
chacun. Cette banque a ete obtenue par 1' utilisation 
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d'une enzyme correspondant & un site de frequence 
th6orique 1/1024 (de type AT(ACGT) (TGCA)TA). 

Tous types de banques d f ADN, tels que celles 
obtenus par amplification au hasard par PCR utilisant 
des oligonucleotides d6g6n6r6s ou non, entrent dans le 
cadre de la pr6sente invention. 

En consequence, 1 1 invention a pour objet un 
proc6d6 de clonage d ! un fragment d'acide nucieique 
comprenant les etape suivantes : 

- on prepare une banque d'ADN susceptible de 
contenir ledit fragment, 

- on crible ladite banque en utilisant de 
fagon combinatoire au moins 10 et de preference 50 £ 70 
enzymes de restriction, pour isoler par tout moyen 
appropri6 le clone contenant ledit fragment, 

Dans ce proc6d6, la preparation de la banque 
d'ADN susceptible de , contenir le fragment d'acide 
nucieique, consiste a inserer chacun des fragments d'ADN 
d'un echantillon dans un vecteur depourvu de tout site 
de clivage par des enzymes de restriction & 

1' exception : 

- d'un site pour la construction de la 

banque, et 

eventuellement de deux autres sites 
identiques, different s du premier ou des premiers 
site(s) et le(s) flanquant, utiles pour sous-cloner la 
sequence d'acide nucieique une fois celle-ci identifiee 
et clonee. 

Dans une autre forme de realisation de ce 
procede, on insere chacun des fragments d'ADN d'un 
echantillon dans un vecteur substantiellement depourvu 
de tout site de clivage par des enzymes de restriction & 

1* except ion : ^ 

- de deux sites pour la construction de la 

banque, orientee, et 



WO 99/28451 



7 



PCT/FR98/02629 



6ventuellement de deux autres sites 
identiques ou non, diff6rents des deux premiers sites et 
le(s) flanquant, utiles pour sous-cloner la s6quence 
d'acide nucl6ique une fois celle-ci identifi6e et 
clon6e. 

Le proc6d6 comprend plus particulierement 
les 6tapes suivantes : 

a) on prepare une banque d'ADN susceptible 
de contenir ledit fragment d'acide nucleique, consistant 
k insurer chacun des fragments d'ADN d'un 6chantillon 
dans un vecteur substantiellement d^pourvu de tout site 
de clivage par des enzymes de restriction mais 
conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- 6ventuellement au moins deux autres sites, 
et de pr6f6rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner le fragment d'acide 
nucl6ique une fois celui-ci identifies et clon§. 

L'fechantillon a partir duquel sont issus les 
fragments constituant la banque peut etre toute cellule 
eucaryote (mammifere, plante, levure, etc.), ou tout 
organisme procaryote (virus, bact6rie, etc.,.). II peut 
s'agir d'ADN gfenomique, d'ADNc, de fragments 
d' amplification par PCR ou de tout autre banque d'ADN 
susceptible d'etre pr6par£e par l'homme du metier. 

b) On realise la digestion en parallele de 
la banque par plusieurs enzymes de restriction, au moins 
10 et de preference environ 50 £ 70 enzymes de 
restriction de fagon a obtenir autant de banques mono- 
diger6s que d 1 enzymes utilisees. 

c) On trans fecte independamment les banques 
mono-dig6r6es dans des hotes cellulaires appropries de 
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fagon k obtenir des lots correspondant d'hdtes 
cellulaires. 

d) On teste par tout moyen appropri6 chacun 
des lots obtenus k l'6tape (c) pour ^valuer I'int6grit6 
de la sequence d'acide nuclfeique k doner et ainsi 
6tablir sa CEM. 

En effet, si la digestion par une enzyme 

d6sign6e "I" n'alt£re pas l'int6grite de 1' insert 

r 

present dans la banque, celui-ci est consider^ I , au 
contraire, si elle I'alt^re, celui-ci est consid£r6 I s . 

Les etapes (a) a (d) ci-dessus permettent 
1' analyse du fragment a doner selon 1' invention. 

Le procede de 1" invention comprend en outre 
les Stapes suivantes permettant de purifier le fragment 
k doner : 

e) On reprend la banque totale de l'6tape 
(a) et on la digere sensiblement simultanfement par les 
enzymes qui n'affectent pas I'int6grit6 du fragment & 
doner. Pour lesquelles il a done et6 considfere "r". 

f) On isole le clone resistant contenant le 
fragment d'acide nuclfeique k doner par tout moyen 
a ppropri6 et 6ventuellement on le sous-clone en 
utilisant les deux sites m6nag6s dans le vecteur k cet 
effet. 

g) On sequence eventuellement le fragment 
d'acide nucl6ique ci doner. 

La digestion multiple de l'£tape (e) a pour 
effet de cliver la totality, ou la quasi-totalit6, des 
fragments d'ADN constituant ia banque, k l'exception du 
fragment k doner. 

L'isolement du clone resistant contenant le 
fragment d'acide nucleique k doner de l'6tape (f) peut 
etre realise par transformation de la banque multi- 
diger^e dans des bacteries competentes, ou par PCR en 



WO 99/28451 



9 



PCT/FR98/02629 



utilisant des oligonucleotides amorces flanquant le site 
de clonage de la banque. 

Event uellement, par s6curite on peut 
effectuer des 6tapes de verification entre les etape (a) 
et (b) d'une part, et (e) et (f) d' autre part 
consistant : 

a 1 ) A verifier la presence du fragment 
d'acide nucl6ique & doner dans la banque en 
transfectant dans un h6te cellulaire qui n'a pas ledit 
fragment et en testant par tout moyen approprie la 
presence du fragment dans ledit hote. Avantageusement, 
on utilise dans cette etape (a') des cellules COS, 
classiquement mise en oeuvre pour les transfections. 

e') A transformer la banque multi-dig6ree de 
l'6tape (e) dans des hdtes competents de fagon k 
verifier la nature des fragments clones. Par exemple, 
cette etape consiste & etaler sur petri et verifier par 
minipr^parations d'ADN plasmidique (miniprep) que les 
inserts sont bien sensibles aux enzymes notees "s" lors 
de 1' etablissement de la CEM. 

Avantageusement, la banque d'ADN pr£par6e a 
l'etape (a) contient de 1 a 10 8 et de preference de 
I'ordre de 10 5 £ 4.10 6 fragments differents de I'ordre 
de 0,1 kb & 5 kb chacun, et de preference de I'ordre de 
1 & 2 kb* 

Dans le proc6de de 1' invention, on prefere 
que les deux sites de sous-clonage soient des sites 
octonucieotidiques, de fagon a minimiser le risque que 
des sites B soient presents dans les inserts clones. 

Dans un mode de realisation tout particulier 
du proc6d£ de 1' invention, la banque ne contient plus de 
vecteur seul referme sur lui-meme. II est done 
avantageux que le vecteur de 1' invention contienne un 
systeme qui 6 limine tout vecteur seul referme sur lui- 
m§me, comme un ge»ne suicide, un systeme de disruption de 
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la proximit6 d'un promoteur lambda ou tout autre syst&ne 
connu de l'homme du metier. 

Les tests realises aux etapes (d) et <a f ) 
pour verifier 1 ' int^grite de la sequence d'acide 
nucl6ique ci cloner peuvent etre tout moyen de mise en 
Evidence soit de la sequence elle-m§me, comme une sonde, 
soit de la prot6ine cod6e par ladite sequence, tel qu'un 
ligand comme un anticorps, ou encore de l 1 activity de 
cette prot^ine, comme un marqueur enzymatique, qui 
peuvent §tre d6tect£es par tout moyen connu de l'homme 
du mfetier, comme un marquage fluorescent ou radioactif ♦ 

Les applications du proced6 de clonage selon 
l 1 invention sont tr6s nombreux et l'on peut citer 
notamment celles dfetaillees dans les exemples ci-apr£s : 
Le clonage d'un gene par banque 

d' expression . 

- Le clonage par homologie. 

- Le Southern Blot d' identification d6nomm6 
par l'Inventeur "identiblot" . 

- L'6tude du polymorphisme. 

Aussi, on d^signera indif f^remment dans ce 
qui suit par g6ne ou insert ou sequence, le fragment 
d'acide nucleique a cloner selon le proc§de de 
1' invention d6crit ci-dessus. 

Un proc6d6 de clonage d'un g6ne par banque 
d' expression selon 1' invent ion comprend les Stapes 
suivantes : 

a) On prepare une banque d'ADNc susceptible 
de contenir ledit g&ne en inserant ladite banque dans un 
vecteur substantiellement d&pourvu de tout site de 
clivage par des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 
la banque, et 
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- 6ventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le 
flanquant, utiles pour sous-cloner le gene une fois 
celui-ci identifies et clone. 

b) On verifie la presence du gene recherche 
dans la banque en trans feet ant dans une lign6e 
cellulaire qui n'a pas 1' activity ou le ph£notype 
recherche et en mesurant sa restauration par une 
technique permettant de distinguer les cellules 
transfect6es des cellules non transfectees, par exemple 
par test cytometrique ou enzymatique. 

c) On digere la banque independamment par au 
moins 10 et de preference environ 50 a 70 enzymes de 
restriction. 

d) On trans feet e independamment les banques 
mono-dig6rees de l'etape (c) . 

e) On teste par tout moyen approprie chacun 
des lots obtenus & l'etape (d) pour la presence de 
1' activity associee au g£ne & doner et on lvalue 
1' integrite de la sequence dudit gene afin d'etablir la 
CEM de 1' activity associee audit gene. 

On entend par activity associee au g£ne la 
detection par tout moyen de la proteine cod6e par ledit 
g£ne ou de l'activite de cette proteine quelle qu'elle 
soit (ligand, enzyme, induction de tumeur, etc — ). 

f) On reprend la banque totale de l'etape 
(a) et on la digere sensiblement simultanement par les 
environ 50 k 55 enzymes qui, en moyenne, n'affectent pas 
l 1 activity mesuree a l'etape (e) . En consequence, 
statist iquement, tous les fragments constituant la 
banque seront clives, a 1' exception du fragment 
recherche . 

g) On transforme la banque multi-digeree 
dans des bacteries competentes. En consequence, seuls 



WO 99/28451 



12 



PCT/FR98/02629 



les vecteurs contenant un fragment non cliv6 seront 
transformes dans les bactferies comp6tentes. 

h) On sous-clone en utilisant la ou les 
enzymes correspondant au (x) site(s) de sous-clonage 
m6nag6(s) dans le vecteur, puis 6ventuellement on 
sequence le g6ne. 

L f invention concerne 6galement, les banques 
mono- ou multi-diger6es obtenues dans le proc6d6 de 
1' invention et notamment aux 6tapes (c) et (f) des 
proc6d6s ci-dessus, ainsi que les supports, tels que des 
tubes, des membranes, des plaques, des gels, etc... qui 
peuvent contenir lesdites banques, leur produit 
d' expression ou des hotes les contenant. 

L f invention se rapporte aussi aux hotes 
cellulaires ou bacteriens contenant les banques ci- 
dessus. 

Un proced& de clonage par homologie selon 
1' invention comprend les 6tapes suivantes : 

a) On prepare une banque d'ADNc comme d§crit 
& l f 6tape (a) pr^cfedente. 

b) On dig^re la banque ind^pendamment par 
chacune d f au moins 10 et de pr6f6rence environ 70 
enzymes de restriction. 

c) On transforme les produits de la 
digestion de l'etape (b) dans des bact6ries competentes. 

d) On fait pousser les bacteries 
transform6es en milieu s61ectif-, de fagon a produire des 
banques diger^es debarrass6es des produits cliv6s. 

e) On clive separ&ment chacune de ces 
banques par la ou les enzymes correspondant au(x) 
site(s) de sous-clonage manage (s) dans le vecteur et 
l'on depose separ6ment chacun de ces produits de 
digestion dans un puits de gel d' agarose ou 
d'acrylamide. 
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f) On fait migrer les produits de digestion 
de l'6tape (e) , puis l'on transf^re sur membrane par 
exemple de nitro-cellulose, et l'on hybride avec une 
sonde sptcifique du g&ne & doner par homologie, ou bien 

5 l'on depose directement les produits de l'etape (d) sur 

une membrane de nitrocellulose. 

g) On analyse la CEM du signal. 

e) On fait les multi-digestions 
correspondantes, de fagon & ce que le seul clone 
10 resistant soit le vecteur portant le g&ne a doner. 

Le proced§ de clonage par homologie ci- 
dessus peut £tre appliqu6 k 1 ■ identification : 

a) d' alleles de diff^rentes souches 
15 d'animaux de la meme esp&ce, ou de differents individus 

chez 1'homme (souvent tr6s homologues). 

b) d' Equivalents geniques presents chez 
diff6rentes esp&ces (moder6ment homologues) . 

c) d' 6pis sages alternatifs d'un meme g£ne au 
20 sein d'un m£me tissu ou entre differents tissus 

(homologie totale par sections) . 

d) de differents membres d'une famille 
g6nique, distribute au sein d'un m§me tissus ou dans 
differents tissus. (homologie imprevisible, souvent tres 

25 forte dans certains domaines) . 

La version simplififee de ce proc6d§ consiste 
h effectuer des dots au lieu de Blots, c' est-a-dire a 
s'abstenir de cliver les banques mono-digerees par 
1' enzyme correspondant au site de sous-clonage menag6 

30 dans le vecteur, et de les deposer directement en un 

point sur une membrane de nitro-cellulose. 

Un proc6d6 de Southern Blot d' identification 
d' inserts selon 1' invention permet d* identifier un 
35 fragment d'ADN sans avoir a le sequencer meme 
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partiellement . Ce proc^de comprend les 6tapes 
suivantes : 

(a) on prepare une banque d'ADN susceptible 
de contenir ledit insert, consist ant & insurer chacun 
des fragments d'ADN d'un £chantillon dans un vecteur 
substantiellement d6pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- 6ventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner 1' insert une fois 
celui-ci identifi§ et clone. 

b) On digere cette banque par chacune d f au 
moins 10 et de preference environ 50 & 70 enzymes de 
restriction. 

c) On transforme les banques monodig6r6s 
obtenues & l'6tape (b) ci-dessus dans des bacteries 
competentes, ou des hates equivalents. 

d) On fait pousser les bacteries en milieu 
s&lectif, de fagon a produire des banques monodiger&es 
d6barassees des produits cliv&s. 

e) On clive separement chacune de ces 
banques par 1' enzyme correspondant aux deux autres sites 
identiques et different du premier ou des premiers 
site(s) et le(s) flanquant, et on depose les produits de 
digestion dans les puits d'un gel ' d' agarose ou 
d'acrylamide. 

f) On fait migrer ce gel et on le transf£re 
sur une membrane par exemple de nitrocellulose. 

g) On utilise les inserts £ identifier conime 
sondes marquees, soit un par un, soit plusieurs par 
plusieurs . 

h) On teste par tout moyen approprie chacun 
des lots obtenus a l'etape (g) pour associer les inserts 
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k identifier A une CEM. Cette CEM correspond A 1' action 
des enzymes de 1 ' 6tape (b) . 

Un proc6d6 d'fetude du polymorphisme selon 
1" invention est identique au procedfe de Southern Blot 
d' identification d' inserts mais est caracterisfe en ce ce 
que : 

- La banque d'ADN gfenomique de l'6tape (a) 
est issue du sujet 6tudie, par exemple d'un malade, ou 
de sujets de la famille du malade. 

- Les inserts utilises comme sondes sont des 
marqueurs de polymorphisme dejd decrits. 

Le proc6de d'fetude du polymorphisme selon 
1" invention trouve son application soit dans le cadre de 
la recherche de marqueurs du polymorphisme associes a 
une pathologie, soit dans le cadre d'un diagnostic de 
cette pathologie. 

Une variante du procedfe de clonage precedent 
pour l'fetude du polymorphisme d'un individu comprend les 
6tapes suivantes : 

a) On d&finit la CEM de chacun des marqueurs 
connus de fagon & permettre leur identification. 

b) On const itue une banque d'ADN genomique 
du sujet 6tudie consistant a insurer chacun des 
fragments d'ADN d'un fechantillon dans un vecteur 
substantiellement dfepourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles . pour sous-cloner 1' insert une fois 
celui-ci identifie et clone. 
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c) On effectue la digestion de la banque par 
des batteries d' enzymes correspondant aux CEM attributes 
aux marqueurs etudi6s. 

d) On transforme les banques multidig6r§es 
dans des bact6ries competentes. 

e) On cultive ces bacteries en milieu 
liquide ou solide contenant 1' agent selectif du 
plasmide. Si 1' allele recherche existe, les bacteries 
poussent, par contre, si cet allele n' existe pas, elles 
ne poussent pas, et l'on dispose ainsi d'un profil pour 
chaque allele. 

Avantageusement, & l'etape (b) , on prepare 
une banque dont les fragments ont une longueur moyenne 
de 1000 a 4000 et de preference de 2000 nucleotides. 

Un mode de realisation de la variante ci- 
dessus permet egalement la detection des nombreux 
alleles de segments polymorphes, comme par exemple la 
gpl20 des virus HIV ou la p53 d'oncogenes cellulaires, 
dans le cadre de travaux de recherche ou d'un 
diagnostic. Le segment concerne est avantageusement 
amplifie par PCR et clone dans le plasmide, puis le 
procede est identique & celui decrit prec6demment et 
expose en detail dans 1' exemple 6 ci-aprts. 

L' invention a aussi pour objet un melange 

d'au moins 10 et de preference de 50 4 70 enzymes de 

restriction susceptible d'etre utilise dans un procede 
selon 1" invention. 

L 1 invention concerne encore 1 1 utilisation 
d'un vecteur substantiellement depourvu de tout site de 
clivage par des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction 
d'une banque, et 
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- 6ventuellement au moins deux autres sites, 
et de pr6f6rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner des fragments dans 
ladite banque, 

pour cribler une banque d'ADN. 

L' invention a done aussi pour objet une 
banque d'acide nuclfeique clonee dans un vecteur, 
susceptible d'etre preparee dans un proc6d§ decrit 
pr6c6demment, caract6ris& en ce que ledit vecteur est 
substantiellement dfepourvu de tout site de clivage par 
des enzymes de restriction mais conserve : 

- un ou deux sites pour la construction de 

la banque, et 

- frventuellement au moins deux autres sites, 
et de pr6f6rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner les fragments de la 
banque . 

Avantageusement, ledit vecteur porte un 
systfeme qui 61imine tout vecteur seul referm6 sur lui- 
m§me. 

L' invention se rapporte aussi & : 

- une banque d'ADN multi-dig6ree par un 
melange d' enzymes d6crit pr6c6demment, 

- groupe de banques d'ADN ou chaque banque 
est mono-dig6r6e ind^pendamment par chacune des enzyme 
du melange d' enzymes d6crit prec^demment, 

ainsi qu'aux hotes cellulaires ou bacteriens 
ou les supports contenant une banque ou un groupe de 
banques ci-dessus. 

D' autres avantages et caracteristiques du 
proc^dfe de l 1 invention apparaitront dans la description 
qui suit se rapportant a des exemples detailles de mise 
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en oeuvre du proc6d6 de 1 1 invention dans diverses 
applications qui ne sauraient etre corisid6r6s comme une 
limitation quelconque de 1' invention. 

fiffigm pTP. 1 : L a preparation et Sexploitation 
H'nnfi banoue d ' expression . 

Une premiere application du proc6d£ de 
1' invention se rapporte £ la pr6paration et k 
1' exploitation d'une banque d 1 expression . 

Cette technique suscite depuis le milieu des 
ann6es 1980 un grand int6r§t. De nombreux g6nes, comme 
ceux codant pour des recepteurs aux cytokines, des 
marqueurs de surface des lymphocytes, des prot6ines 

liant l'ADN, etc ont 6te identifies par cette 

technique (U. Gubler et al., Annals of the N. Y. Academy 
of Science 795 : 36-40, 1996 ; D. Pennica et al. PNAS 
92(4) : 1142, 1995 ; R. M. O'Brien et al., Biochemical 
Journal 312 : 17 - 21, 1995) . Toutefois, les techniques 
de clonage par banque d' expression sont tou jours 
fastidieuses et dif ficilement reproductible s a ce jour. 

Les applications actuelles des banques 
d' expression concernent 1 'identification du gene codant 
pour une proteine, dont les moyens de mise en Evidence 
peuvent etre regroup^ en quatre categories principales : 

- les ant i corps, 

les liaisons prot6ine/prot6ine autre 
qu' anticorps/antig^ne, 

- les oligonucleotides marques par exemple 
par fluorescence dans le cas ovi la prot6ine recherch6e 
est une proteine se liant a l'ADN, 

- les tests d'activite de la proteine, 
quelle qu'elle soit . 

La banque contenant le gene codant pour la 
proteine recherchee peut etre trans formee dans des 
bacteries ou des levures, et l'on utilise l'anticorps, 
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la protfeine ou 1' oligonuctfeotide marqufe pour balayer la 
banque & la recherche de la colonie qui l'exprime. Ces 
syst&nes marchent souvent tr&s mal, car les protfeines 
n' pnt pas la m#me conformation et les mgmes 
modifications post-traductionnelles chez les bactferies 
ou levures et chez les cellules mammifdres. 

Le probl&me de la transfection de banques 
dans les cellules mammifferes reside dans le fait que r & 
la difference des systemes de bactferies ou de levures, 
plusieurs plasmides sont int&grfes dans chaque cellule. 
Pour contenir cette difficulty, il est nfecessaire 
d'utiliser des techniques de f ractionnement successif 
des banques, ou de tris cytof luorimetriques repetes (T. 
Kitamura et al., PNAS 92 (20) : 9146, 1995 ; D. R. 
Gehlert et al., Molecular Pharmacology, 49 (2) : 224, 
1996) . Chacune de ces deux techniques represente un 
travail important, tr&s long (plusieurs semaines) , qui 
n'est pas tou jours conclusif, et qui n'est pas adaptfe au 
clonage simultanfe deux inserts ou plus. 

Le procedfe de 1* invention est beaucoup plus 
simple et moins coOteux que tous ceux de l'art ant^rieur 
cite ci-dessus. De plus, il peut etre applique au 
clonage simultanfe de plusieurs inserts. Ce dernier point 
rev£t une importance majeure lorsqu'on sait que beaucoup 
de protfeines de surface sont composfees de plusieurs 
chalnes et n'atteignent la surface que lorsque toutes 
les chalnes sont produites, par exemple dans le cas des 
complexes majeurs d' histocompatibility. Or aucune des 
techniques de l'art anterieur basee sur les banques 
d 1 expression ne permet d' avoir acc6s a ces protfeines. 

Un proc6d6 de 1' invention pour la 
constitution de banques d'expression comprend les etapes 
suivantes : 

a) On prepare une banque en insurant dans le 
site A du vecteur i'ADN complementaire du tissu ou de la 
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lign6e cellulaire d'inter§t. La figure 2 en annexe est 
une representation schematique de cette etape. 

b) On.v^rifie la presence du g£ne recherche 
dans la banque en transfectant dans une lign6e 
cellulaire qui n'a pas 1'activite ou le ph6notype 
recherche et en mesurant sa restauration, par exemple 
avec un anticorps, de fapon & distinguer les cellules 
transfectees (+) des cellules non transfectees (-) . La 
figure 4 et 5 en annexe sont une representation 
schematique de cette etape. 

Avantageusement , on utilise des cellules 
COS, classiquement mise en oeuvre pour les 
transf ections . 

c) On dig^re la banque independamment par 
chacune des 50 & 70 enzymes de restriction disponibles. 
On obtient ainsi 50 & 70 tubes. La figure 6 en annexe 
est une representation schematique de cette etape • 

d) On transfecte ind6pendamment les 50 & 70 
banques mono-digerees, et tester la presence de 
1'activite recherch6e dans chacun de ces 50 a 70 lots de 
cellules transfectees. La figure 7 en annexe est une 
representation schematique de cette etape. 

e) On etablit ainsi la CEM de 1'activite 

recherchee. Si la digestion par 1' enzyme I n'alt&re pas 

1'activite de 1' insert present dans la banque, on notera 

I r . Si elle 1'altere, on notera I s . 

On obtient, dans 1' exemple de la figure 7 en 
s r r 

annexe,- la CEM suivante: I II . . .LXX . 

En moyenne, on estime que 55±4 enzymes sur 
70 auront un r, et 15±4 auront un s pour un insert de 1 
kb. En effet, la probabilite de clivage par une enzyme 
de restriction & site hexanuclueotidique, & une position 
donnee prise au hasard, est p = 1/4 6 = 1/4096. Sur un 
gene dont la taille est n nucleotides, la probabilite 
theorique d'avoir 1, 2, 3, ... clivages suit une loi 
binomiale de probabilite p et de nombre d'evenements n. 
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La probability de n'avoir aucun clivage est C n °P n (l-p)°- 
Dans le cas oil n = 1000, on obtient une probability de 
78,3%. La probability d f avoir un clivage ou plus est 
d'environ 21,7 %. Le nombre moyen d'enzymes ne clivant 
pas est done de 0,783 x 70 = 55, et I'ycart type est 
proche de 4. 

f) On reprend la banque totale et on la 
dig£re sensiblement simultanyment par les 55 enzymes qui 
n'affectent pas 1» activity mesurye qui est associye A 
"r" pour 1' insert recherchy. La figure 8 en annexe est 
une reprysentation schymatique de cette ytape. 

En pratique, cette digestion ne peut ytre 
totalement simultanye pour des raisons de compatibility 
de tampons, et I'on est oblige de 2 ou 3 multi- 
digestions successives correspondant aux deux ou trois 
tampons choisis. 

La probability pour un insert pris au hasard 
d'§tre clivy par x de ces 55 enzymes suit aussi une loi 
binomiale, de probability 0,783 et£ de nombre 
d'yv^nements 55. La probability pour un insert de n'etre 
clivy par aucune des 55 enzymes est done C55 0 x 
<0,783) 55 x (1 - 0,783)° - (0,783)55 = 1,4.10-6. 

II ne reste done, en moyenne, que 1' insert 
recherchy, plus 1,4.10" 6 x 10 5 =0,14 insert parasite. 

L' utilisation partielle de la CEM, 
correspondant uniquement aux enzymes associees & un r, 
est suffisante pour isoler le gyne recherche, lequel est 
dyj^ pur & plus de 85%. 

g) On transforme la banque multi-digyrye 
dans des bactyries compytentes. Avantageusement on ytale 
sur petri et l'on verifie par miniprep que les inserts 
sont bien sensibles aux enzymes notyes "s" lors de 
l'etablissement de la CEM. La figure 9 en annexe est une 
representation schymatique de cette etape. 
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h) On sous-clone en utilisant 1' enzyme B 
dans un vecteur d'6tude, tel que Bluescript. Puis 
avantageusement on sequence . 

Le module d6crit a l'6tape (e) ci-dessus est 
conforme £ la rfealite, mais ne repr6sente qu'une 
moyenne. En effet, la probability de clivage varie d'une 
enzyme de type site hexanucl^otidique ci une autre. 

Chacune de ces 8 §tapes ne demande que tr£s 
peu de temps, puisque le proc£d£ ci-dessus devrait peut 
§tre r6alis6 en 16 jours dont 10 de travail. 

Le proc§d6 de 1' invention permet notamment 
de g6n6rer des banques d' expression pour de nombreux 
tissus et lignees, puis en faire les 50 a 70 simples 
digestions, les transfecter, faire l'extrait cellulaire 
de ces cellules transfectees, et les dfeposer sur une 
membrane comme rep resent e a la figure 10. 

II ne reste alors plus qu'& r6v61er la 
membrane par exemple avec un anticorps selon la 
technique dite de Western blot, afin d'obtenir 
imm6diatement la CEM de 1' insert recherchfe comme 
represents sur la figure 11. La banque est alors multi- 
digeree en fonction de la CEM obtenue, puis on 
transforme des bact6ries competent es avec ce produit 
multi-dig6r6, et le g6ne est clone en 3 jours au lieu de 
plusieurs mois par les techniques de I 1 art antferieur. 

On peut conserver ces membranes ad vitam 
aeternam & 4°C ou congel6es. 

L* exemple ci-dessus est bas6 sur 
l'utilisation d'un anticorps spfecifique mais d'autres 
systemes de revelation du ph6notype associS & la CEM 
peuvent etre utilises, comme un test enzymatique. 
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Le clonage par homologie est intensivement 
utilise par de trEs nombreux laboratoires de biologie 
molEculaire pour 1' identification : 

5 a) d'allEles de differentes souches 

d' animaux de la mEme espEce, ou de dif f erents individus 
chez l'honune (souvent trEs homologues). 

b) d' Equivalents gEniques presents chez 
diffErentes especes (modErEment homologues) . 

10 c) d' Epissages alternatifs d'un m§me gEne au 

sein d'un meme tissu ou entre dif f Erents tissus 
(homologie totale par sections) . 

d) de dif f Erents membres d'une famille 
gEnique, distribute au sein d'un mEme tissus ou dans 

15 dif f Erents tissus. (homologie imprEvisible, souvent trEs 

forte dans certains domaines) . 

Les strategies utilisEes dans I'art 
antErieur sont essentiellement les deux suivantes (M. 
Parmentier et al. f Nature, 355 : 453, 1992) : 

20 - La PCR par homologie et ses dErivEs, 

lesquels soulEvent le problEme du choix des amorces 
alors que l'on ne connait pas les parties conservEes. La 
fenEtre entre le bruit de fond aspEcifique et les vraies 
amplifications homologues est Etroite. De plus, la 

25 partie amplifiEe ne reprEsente le plus souvent pas tout 

le gEne et on est alors obligE d' aller chercher les 
morceaux manquants, et notamment la partie en 5' , par 
des techniques labor ieuses comme la PCR ancrEe. 

L' hybridation de banques existant 

30 actuellement . Cette mEthode est efficace, mais nEcessite 

beaucoup de travail. En outre, elle ne s' applique qu'a 
1 ■ identification d'allEles (a) ou d* Equivalents gEniques 
(b) . Pour 1 'identification des Epissages alternatifs (c) 
ou des different s membres d'une famille gEnique (d) , on 

35 redone tou jours l'ADNc majoritaire, done dans la 

plupart des cas, le gEne dont on dispose dEjci. 
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Le proce.de de 1' invention permet une fois 
qu'on a clon6 un gene, de produire une sonde qui 
s'hybride sur des g&nes homologues. On utilise done 
cette sonde pour p§cher ses homologues par hybridation k 
faible stringence. 

Le proc6d6 de clonage par homologie selon 
1* invention comprend les etapes suivantes : 

a) On prepare une banque d'ADNc comme d6crit 
ci l'6tape (a) de 1 1 exemple 1. 

b) On digere la banque indfependairanent par 
chacune des 70 enzymes de restriction comme comme d6crit 
& l'6tape (c) de 1 1 exemple 1. 

c) On transforme ces 50 S 70 digestions dans 
des bact6ries competentes. La figure 12 en annexe est 
une representation schematique de cette etape. 

d) On fait pousser les bacteries 
trans formees en milieu selectif, de fa^on & produire des 
grandes quantites des banques dig6r6es debarrass6es des 
produits cliv6s (non transformants en raison de leur 
linearisation) . Les Elements cliv6s sont desormais 
absents des banques. La figure 13 en annexe est une 
representation schematique de cette etape. 

e) On clive s6par&ment chacune de ces 
banques par 1' enzyme B. La figure 14 en annexe est une 
representation schematique de cette etape. 

On depose alors separement chacun de ces 50 
& 70 produits de digestion dans un puits de gel 
d' agarose, comme repr6sente a la figure 15 en annexe. 

Puis, on fait migrer, l'on transfere sur 
nitro-cellulose, et l'on hybride avec la sonde, comme 
represente a la figure 16 en annexe. 

f) On analyse la CEM du signal. Ainsi, si 
une bande est presente dans la piste "banque non 
digeree", mais absente dans la piste "banque digeree par 
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I", c'est que 1' insert hybrid^ est sensible a l'enzyme 
I, et ainsi de suite. 

g) on fait les multi-digestions 
correspondantes, et le seul plasmide resistant est le 
plasmide recherch6. Avantageusement, on peut ensuite 
faire des minipreps avec ce plasmide en utilisant les 
enzymes xx s" pour confirmer. 

Ce proc6d6 peut §tre utilise 

industriellement, en proposant les Blots correspondant & 
de nombreuses banques, comme celles r£alis6es dans 
l 1 exemple 1. Ainsi, en disposant de la sonde et des 
Blots judicieusement choisis, il devient quasi imm6diat 
de trouver tous les alleles, correspondants d'espfece, 
epissages alternatifs et isotypes (deux jours de 
travail, sans compter le s^quengage) . 

Une version simplifi6e de ce proc§d6 
consiste a effectuer des Dots au lieu de Blots, c'est-&- 
dire & s'abstenir de cliver les banques mono-digerfees 
par l'enzyme B, et £ les d^poser directement en un point 
sur une membrane de nitro-cellulose * Lors de 
1' hybridation avec la sonde, les points generant un 
signal, par exemple radioactif, correspondraient aux 
enzymes pour lesquelles le plasmide serait resistant. 
Ceux ne retenant plus de signal correspondraient aux 
enzymes pour lesquelles 1' insert est sensible. 1/ analyse 
est alors proche de celle d6veloppee dans 1' exemple 1, 
comme repr§sent6e aux figures 17 et 18 en annexe. 

Cette version simplifiee est cependant 
insuffisante pour doner des isotypes ou des Epissages 
alternatifs exprim^s dans une meme cellule. 



Rv^mplfi 3 : Southern Blot d' i dent i f i ca tipn 
"IdentWot". 
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Les applications pr6c6dentes du proc6d6 de 
I 1 invention visent a simplifier et rendre plus rapide le 
clonage par expression ou par homologie et en offrant de 
nouvelles possibility . 

Le Southern Blot d' identification propose un 
raccourci qui faciliterait les travaux du chercheur 
impliqu6 dans les techniques de clonage moleculaire. 

En effet, Le cas est frequent dans I'art 
anttrieur ou une strategie de .clonage aboutit & 
l'obtention de nombreux inserts, parmi lesquels se 
trouve le gene recherche et de nombreux parasites. Or 
dans l'art anttrieur, pour identifier un insert parmi 
tous ces parasites, il est est indispensable de le 
sequencer, au moins partiellement , ce qui repr£sente un 
travail considerable- Le s6quengage est une technique 
fastidieuse et trop puissante pour ce simple usage 
d r identification d' inserts, en effet la lecture de 10 
nucleotides suffit le plus souvent a identifier un 
insert. Un technique moins puissante, mais moins 
fastidieuse, utilisant la DMD, pourrait lui §tre 
substitute. 

Ainsi, comme decrit precedemment, il est 
possible de f aire des Southern Blots de banques d'ADN 
g6n6mique de fagon industrielle. Une representation 
schtmatique de la preparation d'une telle banque d'ADN 
genomique est donnee a la figure 3 en annexe . Ce 
Southern Blot, rebaptise "identiblot" dans le cadre de 
la presente invention est suffisamment informatif pour 
permettre 1' identification du fragment d'ADN homologue 
de la sonde. 

Ce southern blot est meme cent millions de 
fois trop informatif. En effet, la banque genomique est 
constitute de 4 millions d 1 inserts differents de 1 kb de 
long. Pour les m§mes raison que celles exposees 
prec6demment , un insert pris au hasard sera resistant £ 
55 enzymes sur 70 et sensible a 15. Le nombre de 
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combinaison enzymatique possible est done C70 15 / soit 
70!/ (55! 15!) = 7,2.10 14 . Ce nombre est plus de cent 
millions de fois sup6rieur & la taille de la banque. Le 
fait de consid6rer que les inserts ont tous une taille 
5 diff6rente ajoute encore des possibilites . Chaque insert 

de la banque est done assocife a une CEM originale. 

Ce proc6d6 pr6sente un int6r§t majeur dans 
le cas de strategies de clonages aboutissant & de forts 
taux de clones faux positifs, par exemple dans les cas 
de 1' utilisation de banques soustractives . ou de 
strategies de clonage par insertion. 

En effet, a partir des cinquante clones 
6tudi6s, il suffit de preparer une "sonde multiplex", 
e'est £ dire un marquage commun de cinquante inserts 
(dans un seul tube) , et une seule hybridation du filtre 
de nitro-cellulose. On obtient 1' identity des cinquante 
inserts d'un seul coup, en comparant leurs CEM avec 
celles pr6alablement entrees dans une base de donn6es 
inf ormatique . 

La figure 19 en annexe represent e un exemple 
ou trois sondes A, B, et C ont ete utilis6es 
simultanement . Les inserts genomiques correspondant a 
des CEM non decrites, et eux seuls, seront clon6es par 
exemple par multi-digestion, puis sequences. 

A 1' inverse du cas des banques d'ADNc, dont 
la variety est insondable, il est suffisant de produire 
un seul type de Blot, pour chacune des 10 esp£ces 
30 etudiees couramment en biologie : humain, sour is, rat, 

drosophile, tabac, levure, etc... 

Exemple 4 : Etude du pol ymorphisme humain. 
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Les travaux de recherche menes dans le cadre 
de 1' §tude du polymorphisme necessitent 1 1 utilisation 
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d'un nombre croissant de marqueurs genetiques. Leur 
utilisation dans le cadre du diagnostic des maladies 
g6n6tiques est egalement en forte augmentation. II est 
probable que dans un futur proche des cartes 
personnelles de predisposition g6n6tique pourront 6tre 
etablies, de fagon & ce que chacun §vite de s'exposer & 
certains risques environnementaux, comme le tabac en cas 
de predisposition au cancer du poumon, le sucre pour les' 
terrains diabetiques, etc. ... 

Les techniques disponibles dans I'art 
ant6rieur permettant d'etudier le polymorphisme sur un 
allele sont principalement la PCR, le Southern Blot et 
1' 6tude des marqueurs de l'ADN slatellite 
(potent iellement utilises en combinaison) . La mfethode de 
1" invention constitue done une alternative, plus 
efficaces, & ces techniques. 

La mise en oeuvre du procede de clonage 
selon l f invention pour 1' etude du polymorphisme humain 
est proche de celle de I'exemple 3 ci-dessus. La 
difference majeure reside dans le fait qu' il est 
necessaire de realiser la banque, ses digestions, la 
migration sur gel et le transfert sur membrane, pour 
chaque sujet. 

Ce procede permet egalement de localiser 
tr6s rapidement 1'origine d'une maladie genetique par 
1' analyse des differents membres de la famille hebergeant 
la pathologie. Dans une famille dite "a risque" pour une 
pathologie, il convient de faire les Identiblots 
correspondant aux differents membres de la famille, et de 
les tester au moyen de polysondes faites a partir des 
marqueurs genetiques deja existants. En un jour, on peut 
hybrider au moins vingt membranes, soit obtenir 1' allele 
de 1000 marqueurs. Les facteurs genetiques multiples 
pourraient etre definis avec cette technique. 

Cette application du proced6 de l 1 invention 
implique un investissement en temps de l'ordre de 
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plusieurs heures de travail, mais est rapidement 
rentabilisE par la possibility de tester les marqueurs 
de prEdisposition gEnEtique 50 par 50, au moyen de 
sondes multiplex prEparees en routine et constitutes du 
nombre Equivalent de marqueurs. 

Example 5 : DeuxiEme approche de 1' Etude du 
polymorph isme humain selon 1' invention . 

Cette seconde mise en oeuvre du procede de 
1' invention k 1' Etude du polymorphisme concerne 
l 1 application de la DMD a 1' Etude des marqueurs 
gEnEtiques par RFLP. Le procEdE selon 1* invention 
comprend alors les Etapes suivantes : 

a) On a prEalablement dEf inis la CEM de 
chacun des marqueurs connus de fagon a permettre leur 
identification, Cette identification est faite une fois 
pour toutes et un polymorphisme est done caractErise par 
une variation de la CEM. 

b) On constitue une banque d'ADN gEnomique 
du sujet EtudiE dans le vecteur prEcEdemment dEcrit. 
Comme indiquE prEcEdemment, il peut Etre avantageux que 
les vecteurs seuls ligues sur eux-mEmes soient EliminEs. 
Avantageusement, on prEpare une banque dont les 
fragments ont une longueur moyenne de 2000 nuclEotides. 

c) On effectue la digestion de la banque par 
des batteries d' enzymes correspondant aux CEM attribuEes 
aux marqueurs EtudiEs. 

Ainsi, par exemple, dans le premier puits, 
on met les cinquante enzymes qui vont digErer toute la 
banque sauf un premier marqueur . Dans le second puits, 
on met une autre batterie d' enzymes pour un second 
marqueur, etc. , . 

d) On transforme les banques multidigerEes 
dans des bactEries compEtentes. 
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e) On cultive en milieu solide (boite de 
petri) contenant 1' agent selectif du plasmide de fagon 6 
ce que si 1' allele recherch§ existe, les bact6ries 
poussent. Par contre, si cet allele n'existe pas, elles 
5 ne poussent pas. On dispose ainsi d'un profil pour 

chaque allele, et l'on peut 6tudier un nombre illimit6 
de marqueurs en une seuie fois. 

Ce proofed^ peut §tre automatism en pr6parant 
des plaques de 96 puits contenant tous les melanges 
10 enzymatiques, ces plaques sont stockees en congelateur. 

Diff6rents types de plaques pourraient §tre produites: 

- Marqueurs repartis sur tout le genome. 

- Marqueurs r6partis sur un seul chromosome. 

- Marqueurs repartis sur une region precise. 
15 - Marqueurs relics aux risques de 

pathologies . 

- Etc 

On distribue dans chaque puits une quantity 
fixe d'ADN sous forme de banque, puis l'on incube & 37°C 

20 pour les digestions. On rajoute alors les bacteries 

comp6tentes, et on suit le m6canisme classique de 
transformation (choc thermique, incubation sans agent de 

selection, etc ). On pr61&ve k la pipette 96 canaux et 

l'on depose sur un p6tri. La lecture est effectu6e & 

25 1'oeil ou & l'aide d'un spectrophotom^tre. 

Cette seconde approche off re l'avantage 
d'etre facilement automatisable, et confdre k grande 
&chelle un gain de temps tres important. En effet, il 
faut tester un grand nombre de marqueurs pour chaque 

30 individu, car la creation de la banque repr^sente un 

invest issement en travail. En outre, elle permet de 
s'exon§rer de toute radioactivite, coOteuse et nocive. 
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Exemple 6 : Troisieme approche de l'£tude du 
polymorpbi .qme humain se lon 1' invention. 
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Cette variante du procfede d'6tude du 
polymorphisme humain selon 1' invention se rapporte & 
1' application de la DMD & l'6tude des differents alleles 
d'un seul marqueur. 

Dans I'art ant§rieur, ces differentiations 
se font essentiellement par s6quengage. Dans un futur 
proche, les puces d'ADN <T. Pastinen et al., Genome 
Research 7 : 606-14, 1997 ; J. G. Hacia et al., Nature 
Genetics, 14 : 441, 1996), permettront d 1 automatiser ces 
travaux. Ceux-ci sont particuliferement utiles dans le 
cas de l'examen de la gpl20 du virus HIV ou d 1 oncogenes 
cellulaires tels p53, presents sous de nombreux alleles. 

Conformfement & la presente invention, cette 
variante consiste a prealablement d6finir la GEM de 
chacun des alleles du segment 6tudi6. Cette 
identification est realisee une fois pour toute et se 
limite aux alleles comportant au moins un site de 
restriction de difference. Puis on amplifie par PCR le 
fragment etudie. On clone ledit fragment dans le vecteur 
de l 1 invention. Ce procede est done tr£s proche de celui 
de l'exemple 5, mais avec une banque comportant 
seulement un ou deux inserts correspondant aux deux 
copies du gene present chez un individu. La suite de ce 
proc6d6 est identique k celle de l'exemple 5. 

Ce travail peut etre realise simultan6ment 
sur plusieurs inserts & la fois. 
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RE VEND I CAT I QN S 

1) Proc6d6 de clonage d'un fragment d'acide 
nucleique, caract6rise en ce qu f il comprend les §tape 

5 suivantes : 

- on prepare une banque d'ADN susceptible de 
contenir ledit fragment d'acide nucleique & doner, 

- on crible ladite banque en utilisant de 
fagon combinatoire au moins 10 et de pr6f£rence 50 & 70 

10 enzymes de restriction, pour isoler par tout moyen 

appropri6 le clone contenant ledit fragment. 

2) Proc6d6 selon la revendication 1, 
caract6ris6 en ce que la preparation de la banque d'ADN 

15 susceptible de contenir le fragment d'acide nucleique & 

doner, consiste a insurer chacun des fragments d'ADN 
d'un 6chantillon dans un vecteur substantiellement 
d6pourvu de tout site de clivage par des enzymes de 
restriction mais conservant : 

20 - un ou deux sites pour la construction de 

la banque, et 

- feventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 

25 flanquant, utiles pour sous-cloner le fragment d'acide 

nuclfeique une fois celui-ci identifi§ et clon6. 

3) Procede de clonage d'un fragment d'acide 
nucleique selon l'une des revendications 1 a 2, 

30 caract£ris6 en ce qu'il comprend les etape suivantes : 

(a) on prepare une banque d'ADN susceptible 
de contenir le fragment d'acide nucleique, consistant a 
inserer chacun des fragments d'ADN d'un echantillon dans 
un vecteur substantiellement depourvu de tout site de 

35 clivage par des enzymes de restriction mais conservant : 
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- un ou deux sites pour la construction de 

la banque, et 

- 6ventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner le fragment d'acide 
nucieique une fois celui-ci identifie et clone. 

(b) On realise la digestion en parallde de 
la banque par plusieurs enzymes de restriction, au moins 
10 et de preference environ 50 & 70 enzymes de 
restriction de fagon obtenir autant de banques mono- 
dig6r6s que d' enzymes utilisees. 

(c) On transfecte independamment les banques 
mono-dig6r§es dans des h6tes cellulaires appropries de 
fagon a obtenir des lots correspondant d f h6tes 
cellulaires. 

(d) On teste par tout moyen approprie chacun 
des lots obtenus & l'6tape (c) pour ^valuer l'integrite 
du fragment d'acide nucieique & doner et ainsi etablir 
sa CEM. 

4) Proc6d6 selon la revendication 3, 
caracterise en ce qu'il comprend les etapes suivantes : 

(e) On reprend la banque totale de I'etape 
(a) et on la digdre sensiblement simultanement par les 
enzymes qui n'affectent pas l'integrite du fragment 
d'acide nucieique a doner. 

(f) On isole le clone resistant contenant le 
fragment d'acide nucieique a doner par tout moyen 
approprie et eventuellement on le sous-clone en 
utilisant les deux sites menages dans le vecteur & cet 
ef f et . 

(g) On sequence eventuellement le fragment 
d'acide nucieique clone. 
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5) Proc6de selon les revendications 3 ou 4, 
caract6ris6 en ce qu'il comprend entre les §tape (a) et 
(b) l»6tape suivante : 

(a 1 ) on v§rifie la presence du fragment 
d'acide nucl£ique k doner dans la banque en 
transfectant dans un hote cellulaire qui n'a pas ledit 
fragment et en testant par tout moyen appropri6 la 
presence du fragment dans ledit h6te. 

6) Proced6 selon les revendications 4 et 5, 
caract6rise en ce qu'il comprend entre les 6tape (e) et 
(f) l'gtape suivante : 

(e') On transforme la banque multi-digeree 
de l'6tape (e) dans des hdtes compfetents, de fapon a 
verifier la nature des fragments clones. 

7) Proc6de selon l f une quelconque des 
revendications 1 A 6, caracterisfe en ce la banque d'ADN 
contient de 1 & 10 8 et de pr6f£rence de I'ordre de 10 5 k 
4.10 6 fragments diff6rents de I'ordre de 0,1 kb k 5 kb 
chacun, et de pr6f6rence de I'ordre de 1 k 2 kb, 

8) Proc&d6 selon l'une quelconque des 
revendications 3 a 7, caracterise en ce que les tests 
realises aux etapes (d) et/ou (a 1 ) pour verifier 
1' integrity de la sequence d'acide nucl6ique a doner 
sont tout moyen de mise en Evidence soit de la sequence 
elle-meme, corame une sonde, soit de la prot&ine cod6e 
par ladite sequence, tel qu'un ligand comme un 
anticorps, ou encore de 1'activite de cette proteine, 
comme un marqueur enzymatique, qui peuvent etre 
d§tectees par tout moyen connu de l'homme du metier, 
comme un marquage fluorescent ou radioactif . 

9) Procede de clonage d'un gene par banque 
d'expression selon l'une quelconque des revendications 1 
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& 7; caract6ris6 en ce qu'il comprend les 6tapes 
suivantes : 

a) On prepare une banque d'ADNc susceptible 
de contenir ledit g£ne en inserant dans un vecteur 
substantiellement d6pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- 6ventuellement au moins deux autres sites, 
et de pr§f§rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le (s) 
flanquant, utiles pour sous-cloner le g6ne une fois 
celui-ci identifi6 et clon§. 

b) On v^rifie la presence du g&ne recherche 
dans la banque en trans fectant dans une lign§e 
cellulaire qui n'a pas 1' activity ou le ph6notype 
recherche et en mesurant sa restauration de fagon a 
distinguer les cellules transfectees des cellules non 
transfectfees . 

c) On digere la banque ind^pendamment par au 
moins 10 et de pr6f6rence environ 50 a 70 enzymes de 
restriction. 

d) On transfecte independamment les banques 
mono-dig6rees de l'6tape (c) . 

e) On teste par tout moyen approprife chacun 
des lots obtenus k l'6tape (d) pour la presence de 
l'activite associ£e au g6ne & doner et on lvalue 
l'integrite de la sequence dudit g&ne afin d'etablir la 
CEM de l'activite associ^e audit gene. 

f) On reprend la banque totale de l'etape 
(a) et on la digdre sensiblement simultanement par les 
environ 50 S 55 enzymes qui n'affectent pas l'activite 
mesur£e k l'6tape (e) . 

g) On transforme la banque multi-digeree 

dans des bact&ries competentes. 
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h) On sous-clone en utilisant 1' enzyme 
correspondant au site de sous-clonage m6nag6s dans le 
vecteur, puis 6ventuellement on sequence le g6ne. 

10) Proc6d6 de clonage par homologie selon 
l'une quelconque des revendications 1 a 9, caracteris6 
en ce qu'il comprend les etapes suivantes : 

(a) on prfepare une banque d'ADN susceptible 
de contenir ledit fragment d'acide nucleique, consistant 
& insurer chacun des fragments d'ADN d'un fechantillon 
dans un vecteur substantiellement depourvu de tout site 
de clivage par des enzymes de restriction mais 
conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- event uellement au mo ins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le (s) 
flanquant, utiles pour sous-cloner le fragment d'acide 
nuclfeique une fois celui-ci identifi§ et clone. 

b) On dig^re la banque independamment par 
chacune d'au moins 10 et de preference environ 50 a 70 
enzymes de restriction, 

c) On transforme les produits de la 
digestion de l'fetape (b) dans des bacteries compdtentes . 

d) on fait pousser les bacteries 
transformers en milieu sfelectif , de fagon a produire des 
grandes quantites des banques digerees debarrass6es des 

produits clives. 

e) Eventuellement on clive s^parement 
chacune de ces banques par 1' enzyme correspondant au 
site de sous-clonage menage dans le vecteur et 1 I'on 
depose s^parement chacun des produits de digestion dans 
un puits de gel d' agarose. 

f ) f ) On fait migrer les produits de 
digestion de l'etape (e) , puis I 1 on transfere sur 
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membrane par exemple de nitro-cellulose, et I'on hybride 
avec une sonde sp6cifique du g6ne & doner par 
homologie, ou bien l'on d6pose directement les produits 
de l'6tape (d) sur une membrane de nitrocellulose. 

g) On analyse la CEM du signal. 

e) On fait les multi-digestions 
correspondantes, de fagon a ce que le seul vecteur 
resistant soit le vecteur portant le gdne & doner. 

11) Application du proc6d6 selon la 
revendication 10 k 1 1 identification : 

- d' alleles de differentes souches d'animaux 
de la m§me esp6ce, ou de dif ferents individus chez 
1' homme, 

d' equivalents g£niques presents chez 
diff6rentes esp^ces, 

- des epissages alternatifs d'un g£ne. 

de dif ferents membres . d'une famille 

g£nique. 

12) Proc6d6 de Southern Blot 
d' identification d 1 inserts mettant en oeuvre un proc6d6 
de clonage d'une sequence d'acide nucl6ique selon I'une 
quelconque des revendications 1 A 10, caracteris6 en ce 
qu'il comprend les etapes suivantes : 

(a) on prepare une banque d T ADN susceptible 
de contenir ledit insert, consistant & inserer chacun 
des fragments d'ADN d'un 6chantillon dans un vecteur 
substantiellement d6pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de preference seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
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flanquant, utiles pour sous-cloner 1' insert une fois 
celui-ci identifies et clon6. 

b) On digere cette banque par chacune d'au 
moins 10 et de prEfErence environ 50 £ 70 enzymes de 
restriction. 

c) On trans forme les banques monodig6r6s 
obtenues ii l'Etape (b) ci-dessus dans des bactEries 
compEtentes, ou des hotes Equivalents. 

d) On fait pousser les bactEries en milieu 
select if, de fagon & produire des banques dig6r6es 
dEbarassEes des produits cliv6s. 

e) On clive separEment chacune de ces 
banques par la ou les enzymes correspondant au (x) 
site(s) de sous-clonage flanquant le ou les sites de 
construction de la banque, et on depose les produits de 
digestion dans les puits d'un gel d' agarose ou 

d' aery 1 amide. 

f) On fait migrer ce gel et on le transffere 
sur une membrane par exemple de nitrocellulose. 

g) On utilise les inserts k identifier comme 
sondes marquees, soit un par un, soit plusieurs par 
plusieurs . 

h) On teste par tout moyen approprie chacun 
des lots obtenus a 1'Etape (g) pour les associer & une 
CEM. 

13) ProcEde d' Etude du polymorphisme mettant 
en oeuvre un procedE de Southern Blot d' identification 
d 1 inserts selon la revendication 12, caracterisE en ce 
que : 

- La banque d'ADN genomique de l'Etape (a) 
est issue du sujet EtudiE. 

- Les inserts utilises comme sondes sont cles 
marqueurs de polymorphisme. 
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14) Procfedfe d'fetude du polymorphisme 
caract6rise en ce qu'il comprend les 6tapes suivantes : 

a) On d6finit la CEM de chacun des marqueurs 
connus de fagon & permettre leur identification par le 
proc6d6 de clonage selon la revendication 3. 

b) On constitue une banque d'ADN genomique 
du sujet 6tudie consistant & insurer chacun des 
fragments d'ADN d'un 6chantilldn dans un vecteur 
substantiellement d^pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- 6ventuellement au moins deux autres sites, 
et de pr6f§rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner 1' insert une fois 
celui-ci identifie et clone, 

c) On effectue la digestion de la banque par 
des batteries d' enzymes correspondant aux CEM attributes 
aux marqueurs 6tudi6s* 

d) On transforme les banques multidig§r6es 
dans des bacteries competentes. 

e) On cultive ces bacteries en milieu 
liquide ou solide contenant 1' agent selectif du 
plasmide. Si 1' allele recherche existe, les bacteries 
poussent, par contre, si cet allele n' existe pas, elles 
ne poussent pas, et l'on dispose ainsi d'un profil pour 
chaque allele. 

15) Melange d'au moins 10 et de preference 
de 50 a 70 enzymes de restriction susceptible d'etre 
utilise dans un proctde selon l'une quelconque des 
revendications 1 & 14. 



WO 99/28451 



40 



PCT/FR98/02629 



16) Utilisation d'un vecteur 
substantiellement dfepourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction 

d'une banque, et 

- eventuellement au moins deux autres sites, 
et de pr6f6rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner des fragments dans 

ladite banque, 

pour cribler une banque d'ADN. 

17) Une banque d'acide nucl&ique clonee dans 
un vecteur susceptible d'etre prepar^e dans un procedfe 
selon l'une quelconque des revendi cat ions 1 & 14, 
caract6ris& en ce que ledit vecteur est 
substantiellement d^pourvu de tout site de clivage par 
des enzymes de restriction mais conservant : 

- un ou deux sites pour la construction de 

la banque, et 

- eventuellement au moins deux autres sites, 
et de pr6f6rence seulement deux sites, identiques ou 
non, et different du ou des premiers sites et le(s) 
flanquant, utiles pour sous-cloner les fragments de la 
banque . 

18) Une banque selon la revendication 16, 
caract6ris6e en ce que le vecteur porte un syst&me qui 
^limine tout vecteur seul referme sur lui-meme. 

19) Une banque d'ADN selon l'une des 
revendications 16 ou 17, caractferisee en ce qu'elle est 
multi-dig6ree par un melange d' enzymes selon la 
revendicat ion 15. 
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20) Un groupe de banques d'ADN selon I'une 
des revendications 16 ou 17, caract6ris6e en ce qu'elle 
est mono-dig6rfee ind6pendamment par chacune des enzyme 
du melange d 1 enzymes selon la revendication 15. 

21) Les hdtes cellulaires ou bactferiens 
contenant une banque ou un groupe de banques selon I'une 
des revendications 19 ou 20. 

22) Support port ant une banque ou un groupe 
de banques selon I'une des revendications 19 ou 20 ou 
des h6tes cellulaires selon la revendication 21. 
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